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中 多 刺 玫 的 叶绿体 基因 组 特征 及 种 内 变 弄 


EEN, BER. ?， 王 慧 纯 1， 马 长 乐 ?， 受 慧君 !， 邵 显 钦 !， 景 维 坤 :， 蹇 洪 英 民 
CI. 云南 省 农业 科学 院 花 齐 研究 所 ， 昆 明 650205; 2. 西南 林业 大 学 
园林 园艺 学 院 ， 昆 明 650224) 
摘要 : 中 多 刺 玫 (Rosa praelucens Byhouwer) 是 云南 香格里拉 县 的 特有 “ 极 危 ?植物 和 国家 二 
级 重点 保护 植物 ,也 是 著名 的 高 山花 卉 和 重要 的 十 倍 体 月 季 种 质 资源 ,种 内 存在 丰富 的 表 型 
多 样 性 。 为 了 澄清 中 旬 刺 玫 种 内 表 型 变异 的 遗传 背景 ， 该 文 利用 二 代 测 序 技术 对 40 个 不 同 
表 型 的 中 多 刺 玫 代 表 性 个 体 的 叶绿体 基因 组 进行 测序 、 组 装 和 比较 分 析 ， 结 果 表 明 : (1) 
中 旬 刺 玫 的 基因 组 序列 长 157 173—157 261bp, 植株 间 仅 相差 88bp, 共 编 码 132 个 功能 基因 ， 
主要 为 与 光合 作用 和 自我 复制 相关 的 基因 。 全 部 基因 共 由 27 155 个 密码 子 编码 ， 以 A- 和 TU- 
为 末端 的 密码 子 较 常见 。(2) 中 旬 刺 玫 的 叶绿体 基因 组 共 鉴 定 出 36 个 重复 序列 和 73 个 简 
单 重 复 序列 ， 后 者 大 部 分 为 单 核 昔 酸 SSRs， 主 要 位 于 大 单 拷贝 区 的 基因 间隔 区 。 (32 中 名 
刺 玫 种 内 叶绿体 全 基因 组 的 单 倍 型 多 样 性 为 0.928+0.027， 核 酸 多 态 性 为 0.00012; 位 于 LSC 
的 petN-trnD、psaA-ycf3 等 基因 间隔 区 ， 以 及 rps16 和 ycfl 等 基因 的 核酸 多 态 性 相对 较 高 ; 
不 同 表 型 的 代表 性 个 体 的 叶绿体 基因 组 间 在 结构 上 不 存在 大 片段 或 基因 的 逆转 或 者 丢失 ,而 
究 结果 表明 中 多 刺 玫 种 内 在 叶绿体 基因 组 大 小 、 序 列 和 基因 结构 等 方面 均 高 度 保 守 ， 其 种 内 
丰富 的 表 型 多 样 性 不 是 由 于 叶绿体 基因 组 的 变异 。 
关键 词 : 中 旬 刺 玫 ， 叶 绿 体 基 因 组 ， 比 较 基 因 组 ， 简 单 重 复 序 列 ， 核 酸 多 态 性 ， 密 码 子 偏好 
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Chloroplast genome features and intraspecific chloroplast 
genomic variation of Rosa praelucens 


WANG Qigang!, CAO Shirui!?, WANG Huichun!, MA Changle?, YAN Huijun!, QIU 
Xiangin!, JING Weikun!, JIAN Hongying!" 
C1. Flower Research Institute, Yannan Academy of Agricultural Sciences, Kunming, 650205, 
China 2., College of Landscape and Horticulture, Southwest Forestry University, Kunming, 
650224, China) 
Abstract: Rosa praelucens is a critically endangered alpine wild flower endemic to Shangrila 
County of Yunnan Province. Rich in phenotypic diversity and with a high ploidy level of 
decaploid, R. praelucens is a very important rose germplasm resource. In order to clarify the 
genetic background of its phenotypic variation, the chloroplast genomes of 40 individual plants 
representing different phenotypes within the species were sequenced by using the Illumina HiSeq 
2000 platform, and then assembled, annotated and compared. The results were as follows: (1) 
Chloroplast genomes of R. praelucens were 157 173-157 261 bp in length, with a size difference 
of 88 bp among different individual plants. The genomes encoded 132 genes, mainly related with 


photosynthesis and self-replication. 27 155 codons, preferring using codon ending of A or U, were 
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found in all the coding sequences. (2) Thirty six repeats and 73 simple sequence repeats (SSRS) 
were detected in the chloroplast genome of R. praelucens. Most of the cpSSRs were 
mononucleotide type and located in the intergenic region of LSC region. (3) The haplotype 
diversity (Hd) among the 40 chloroplast genomes was 0.928+0.027, and the nucleotide diversity 
(Pi) was 0.00012. The intergenic region of pefN-trnD and psaA-ycf3, gene rpsl6 and ycf1 were 
relatively more divergent. No reverse or loss of large DNA fragments and genes were found 
among the cp genomes of different individuals. These results suggested that the chloroplast 
genomes were highly conserved in size, sequence and structure within R. praelucens. The rich 
intraspecific phenotypic diversity was not directly caused by the variation of chloroplast genomes 
among different individual plants. 

Key words: Rosa praelucens Byhouwer, chloroplast, comparative genomics, simple sequence 
repeats (SSRs), nucleotide diversity (P1), codon preference 


叶绿体 在 植物 的 生活 史 中 发 挥 着 重要 功能 (Wicke etal., 20110. 。 大 多 数 维 管 植 物 的 叶 
绿 体 基因 组 长 度 约 为 150 kb 左右 ， 为 保守 的 四 分 体 结构 ， 包 括 一 个 大 单 拷贝 区 Clarge single 
copy, LSC) 、 一 个 小 单 揽 贝 区 (small single copy, SSC) 和 两 个 反 向 重复 区 Cinverted repeats, 
IRs) (Wicke et al., 2011; Shetty et al., 2016; Zhu et al., 2016) 。 高 等 植物 的 叶绿体 基因 组 高 
度 保守 ， 但 某 些 类 群 的 叶绿体 基因 组 中 存在 大 片段 的 倒置 (Sun et al., 2017) 、 大 量 重复 序 
J| CGuisinger et al., 2011) 、 基 因 丢 失 或 假 基因 化 (Ye et al., 2018) 以 及 IR 区 的 扩张 或 收缩 
(Li et al., 2017; Liu et al., 2017) 。 叶 绿 体 基因 组 在 大 多 数 被 子 植 物 中 为 母系 遗传 (Neale & 
Sederoff, 1989; Daniell et al., 2016) 。 与 核 基因 组 相 比 ， 叶 绿 体 基因 组 具有 分 子 量 低 、 结 构 
简单 、 保 守 性 强 等 特点 , 还 包含 大 量 的 重复 序列 , 包括 简单 重复 序列 (simple sequence repeats, 
SSRs) (Cavalier, 2002) ， 因 此 被 广泛 应 用 于 系统 发 育 、DNA 条 形 码 、 基 因 工 程 和 亲缘 关 
系 等 研究 (Dong et al., 2018)。 随 着 二 代 测 序 技术 (next-generation sequencing, NGS) 的 发 展 ， 
越 来 越 多 的 植物 叶绿体 全 基因 组 序列 被 报道 ，NCBI 数据 库 迄 今 已 公布 了 超过 8500 个 植物 
叶绿体 基因 组 。 

PERJE Rosa praelucens) 是 云南 省 香格里拉 县 的 特有 “ 极 危 ?植物 〈 覃 海宁 等 ，2017; 
Ku & Robertson, 2003) ， 也 是 国家 二 级 保护 植物 
Chttp:/www.forestry.gov.cn/main/3954/20210908/163949170374051.html) > FARMER Z 
的 高 山花 开 〈Li & Zhou, 2005) 和 重要 的 月 季 种 质 资源 ， 既 耐寒 〈 邓 菊 庆 等 ，2013 ) 也 高 抗 
蚜虫 ( 范 元 兰 等 ，2021) 。 自 Jian 等 (2010) 发 现 其 是 蓄 薇 属 野生 种 中 唯一 的 最 高 倍 性 一 
上 倍 体 (2n=10x=70〉 以 来 ， 人 们 对 中 旬 刺 玫 的 生境 和 群落 特征 〈 关 文 灵 等 ，2012) 、 繁 育 
系统 〈 伍 翔 宇 等 ，2014) ~ PEMA GIERE, 2016). RAMA E, 2018), 
基于 染色 体 荧光 原 位 杂交 的 核 型 特征 〈 方 桥 等 ，2020) 以 及 遗传 多 样 性 和 遗传 结构 Jian et 
al,2018a) 等 进行 了 系统 研究 ， 发 现 中 多 刺 玫 种 内 存在 丰富 的 表 型 多 样 性 ， 其 中 花色 和 花 型 
变异 尤其 显著 〈 李 树 发 等 ，2013; Jian et al., 2018a) 。 
理解 多 倍 性 如 何 修饰 表 型 性 状 是 进化 生物 学 的 一 个 研究 热点 和 主要 目标 〈Balao et al., 
2011) 。 大 量 研究 表明 自然 形成 或 人 工 诱导 的 多 倍 体 植 物 都 会 产生 遗传 和 表 观 遗传 的 改变 ， 
从 而 改变 基因 的 表达 ， 使 其 在 遗传 、 生 理 和 形态 上 产生 分 化 ， 形 成 新 的 表 型 (Ramsey & 
Schemske, 2002) 。 对 于 十 倍 体 的 中 旬 刺 玫 来 说 ， ! 内 丰富 的 表 型 变异 的 机 制 尚 不 清楚 。 
由 于 中 旬 刺 玫 的 高 倍 性 特征 ， 限 制 了 多 种 分 子 技术 手段 在 其 遗传 背景 研究 上 的 应 用 。Jian 等 
(2017) 报道 了 中 和 旬 刺 玫 的 叶绿体 基因 组 大 小 、 各 分 区 的 长 度 和 GC 含量 、 编 码 的 基因 数 和 
等 基本 信息 ， 发 现 中 旬 刺 玫 的 叶绿体 基因 组 大 小 为 157 186 bp， 与 同属 的 单 办 月 季 花 CR. 
chinensis var. spo1ta1zea) 等 其 它 植物 相 比 ,其 叶绿体 基因 组 最 大 , 且 在 LSC 区 的 psbM 和 trnD 
之 间 有 一 个 长 为 505 bp 的 插入 。 在 此 基础 上 ， 为 了 澄清 中 旬 刺 玫 种 内 表 型 变异 的 遗传 背景 ， 
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究 利 用 二 代 测 序 技 术 对 40 个 不 同 表 型 的 
寸 以 下 问题 (1) 
旬 刺 玫 种 内 不 同 表 型 个 体 在 
传 信息 ,也 为 探讨 其 种 内 表 型 变异 的 分 子 机 制 提供 


本 看 

序 、 组 装 和 比较 分 析 ， 探 i 
好 性 如 何 ? (2) 
结果 将 为 中 多 刺 玫 的 
叶绿体 基因 组 方面 的 基础 数据 。 


1 材料 与 方法 


1.1 研究 材料 


用 于 叶绿体 基 


外 采集 当年 4 


鸭 种 形成 和 保护 提供 更 多 的 遗 


因 组 序列 特征 分 析 的 中 
(99°49'38.1" E, 27°32'16.68" N, 3248 m) ， 
MG450565.1. ER 40 个 不 同 表 型 的 代表 性 植株 的 基本 信息 见 表 1。 于 2021 年 6 
成 熟 健康 叶片 ， 
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叶绿体 基因 组 上 是 否 存在 较 大 的 变异 ? 研究 


1 拉 县 小 中 旬 镇 塘 安 培 


立即 用 硅胶 进行 


表 1 不 同 表 型 的 


甸 刺 玫 


其 原始 序列 已 上 传 至 NCBI， 序 列 号 为 


JRE 


FER, -4 低温 保存 用 于 后 续 实 验 。 
\ 表 性 植株 的 基本 信息 


Table 1 Information of different phenotypes of individuals within Rosa praelucens 


表 型 特征 Phenotypic characteristics 


2 号 v . 
id 花色 15 HAS TEX 来 源 Location 
Flower color Flower size (cm) Petal number 
0-1 白色 White 12.5 3 格 桑 公司 基地 Nursery of Gesang 
Flower Company 
0-2 白色 White 10 5 中 旬 格 桑 公 司 Nursery of Gesang 
Flower Company 
0-3 粉 En (& Pinkish white 8-8.5 和 ~7 布 呵 谷 老 村 Buhegulao Village 
0-4 粉 色 Pinkish white 6~7 5—6 布 呵 谷 老 村 Buhegulao Village 
1-1 玫 红 色 Rose red 11 5-8 iCEDRI Tang'anpei Village 
1-2 粉红 色 Pinkish red 10-12 5-7 B CEDRI Tang'anpei Village 
1-3 粉红 色 Pinkish red 10-13 5-7 基 公 村 Jigong Village 
1-4 粉红 色 Pinkish red 10-12 5-7 基 公 村 Jigong Village 
1-5 粉红 色 Pinkish red 10 5-7] 托 木 南村 Tuomunan Village 
2-1 玫 红 色 Rose red 7~10.5 5 iX Tangpei Village 
2-2 粉红 色 Pinkish red 6.5~9 5 HH% Tangpei Village 
2-3 粉红 色 Pinkish red 8-10 5 Hyi) Tangpei Village 
2-4 粉红 色 Pinkish red 8-10 5 唐 培 村 Tangpei Village 
2-5 粉红 色 Pinkish red — 8-10 5 唐 培 村 Tangpei Village 
2-6 深 粉 红色 Dark pink — 7-10 5 闹 培 村 Tangpei Village 
2-7 桃红 色 Crimson red — 9-11 5-11 XLI Tangpei Village 
深 桃 红 芯 白 Deep 8 5 
3-1 crimson red with 热 水 塘 村 Reshuitang Village 
white core 
深 桃 红 芯 白 Deep 7~10 5 
3-2 crimson red with Zi trf; Bigu Village 
white core 
深 桃 红 芯 白 Deep 7~10 5 
3-3 crimson red with zü ih f Bigu Village 
white core 
4-1 浅 粉红 色 Lightpink —8.5-11 5 胡 批 村 Hupi Village 
4-2 粉色 Pink 8-10 5 胡 批 村 Hupi Village 
4-3 粉色 Pink 8-10 5 胡 批 村 Hupi Village 
4-4 粉色 Pink 8-10 5-71 胡 批 村 Hupi Village 
5-1 粉红 色 Reddish pink — 8-11 5 胡 批 村 Hupi Village 
5-2 粉红 色 Reddish pink — 10-11 5 胡 批 地 Hupi Village 
6-1 深 粉红 色 Dark pink — 9~10 5 布 呵 谷 老 村 Buhegulao Village 
6-2 深 粉 红色 Dark pink —7-10 5 布 呵 谷 老 村 Buhegulao Village 
6-3 深 粉红 色 Dark pink — 10-12 5 布 呵 谷 老 村 Buhegulao Village 
6-4 深 粉 红色 Dark pink — 9-11 5 布 呵 谷 老 村 Buhegulao Village 
6-5 深 粉红 色 Dark pink — 9-12 5 布 呵 谷 老 村 Buhegulao Village 


7-1 粉红 色 Reddish pink — 9-11 5 乃 司 村 Naisi Village 

7-2 粉红 色 Reddish pink — 9-11 5 乃 司 村 Naisi Village 

8-1 淡 粉 色 Light pink 7~8 5 布 呵 谷 老 村 Buhegulao Village 
8-2 淡 粉 色 Light pink 8~10 5~8 布 呵 谷 老 村 Buhegulao Village 
8-3 粉 白色 Pinkish white 11 5 布 呵 谷 老 村 Buhegulao Village 
8-4 粉色 Pink 7-10 5-7 布 呵 谷 老 村 Buhegulao Village 
8-5 粉色 Pink 7-40 5-7 布 呵 谷 老 村 Buhegulao Village 
8-6 粉 白色 Pinkish white 10 5 布 呵 谷 老 村 Buhegulao Village 
9-1 淡 粉 色 Light pink 9~12 5 兆 木 谷 村 Taomugu Village 
9-2 淡 粉 色 Light pink 10~12 5 兆 木 谷村 Taomugu Village 

1.2 研究 方法 


1.1.1 基因 组 总 DNA 的 提取 、 测 序 、 组 装 及 注释 


得 到 约 3.5 Gb 的 150bp 短片 段 原始 序列 (raw data) ， 用 


& Jain, 2012) 按照 默认 参数 对 原始 序列 进行 过 滤 得 选 ， 得 


使 用 改良 的 CTAB 法 进行 中 旬 刺 玫 叶 片 的 总 DNA 提取 ， 达 到 建 库 测序 要 求 的 DNA 送 
到 北京 诺 禾 致 源 科技 股份 有 限 公 司 用 Hlumina Hiseq 2000 测序 平台 进行 建 库 测 序 ， 每 个 样品 
NGSQC Toolkit v2.3.3 软件 (Patel 
到 高 质量 的 有 效 序列 〈clean data). 


使 用 GetOrganelle Chttps://github.com/Kinggerm/GetOrganelle) 进行 de novo 从 头 组 装 ， 得 到 
叶绿体 全 基因 组 序列 。 组 装 好 的 基因 组 序列 使 用 CpGAVAS (Liu et al., 2012) 自动 进行 注释 ， 


注释 完成 后 使 用 Genious 9.1 (Kearse et al., 2012) 进行 校对 和 调 


最 终 使 用 OGDRAW (Lohse et al. 2013) 绘制 叶绿体 基因 双 


1.1.2 叶绿体 基因 组 结构 分 析 


利用 Geneious 软件 对 已 上 传 到 NCBI、 序列 号 为 MG450565.1 的 中 
组 进行 叶绿体 全 基因 组 编码 基因 构成 统计 。 用 Mega 6.06 (Tamura et al., 2013) 进行 密码 子 


偏好 分 析 ， 计 算 同 义 密码 子 相对 


则 刺 下 叶绿体 全 基因 


因 的 边界 区 域 ， 


使 用 值 Crelative synonymous codon usage values; RSCU) 并 统 


计 AT 含量 ,用 重复 序列 分 析 软 件 REPuter XT Chttps://bibiserv.cebitec.uni-bielefeld.de/reputer) 


(Kurtz et al., 2001), 搜索 基因 组 中 的 正 向 重复 (forward repeats ) 和 反 向 村 
序列 。 软 件 运行 时 ， 设 置 搜索 的 重复 序列 长 度 不 小 于 20 bp， 序 列 一 致 性 


利用 MISA (Beier etal., 2017) 软件 来 鉴定 简单 重量 复 序列 (SSRs), 
单 、 二 、 三 、 四 、 五 和 六 核 苷 酸 重复 次 数 分 别 不 小 于 10、5、4、3、3 和 


1.1.3 种 内 不 同 个 体 的 叶绿体 基因 组 序列 比较 


在 Geneious 软件 中 调用 Mauve 程序 (Darling et al., 2004) 对 
的 叶绿体 基因 组 进行 比 对 ， 分 析 不 同 植株 的 叶绿体 基因 组 间 是 


X. 
2 结果 与 分 析 
2.1 中 旬 刺 玫 叶 绿 体 基因 组 的 结构 特征 


中 旬 刺 玫 种 内 不 同 表 型 的 40 个 代表 性 植株 的 叶绿体 基 
GC 含量 、 编 码 基因 数目 等 基本 信息 见 图 1 和 表 2。 中 旬 刺 玫 的 基因 
261 bp， 植 株 间 相差 88 bp。 基 因 组 最 大 的 是 7-1 号 植株 ， 为 157 261 bp， 基 


均 为 26 054 bp， 说 明 种 内 基因 组 大 小 的 差异 主要 来 源 于 LSC f 
在 不 同 个 体 间 没有 显著 差异 ,全 基因 组 的 GC 含 量 均 为 37.2%， 
LSC 区 的 GC EEN 35.2%, SSC 区 的 GC 含量 为 31.2%。 


用 DNASP v5.10 软件 (Librado et al., 2009) 计 算 种 内 叶绿体 基 
diversity, Hd) 和 核 昔 酸 多 态 性 (nucleotide polymorphism, Pi) , fiin £p 


ER IR 区 长 度 


EE 复 (reverse repeats) 
于 85%。 此 外 ， 
搜索 的 阔 值 设置 为 : 


改 40 个 代表 性 植株 
存在 大 片段 的 逆转 或 丢失 ; 
和 倍 型 多 样 性 (haplotype 


因 组 中 的 高 变 


序列 的 长 度 、 各 分 区 长 度 、 

序列 全 长 157 173~157 
因 组 最 小 的 是 
2-5 号 植株 ， 为 157 173 bpe LSC 区 长 为 86 300-863 53 bp， 相差 53 bp， 最 长 的 是 7-1 号 植 
株 ， 最 短 的 是 2-5 号 植株 ;SSC 区 长 为 18 765-18 803 bp， 相 差 38 bp; X H3 


组 的 GC 含量 


其 中 下 区 的 GC 含 量 为 42.7%， 


人 多 9 ur. 
二 中 旬 刺 政 i 
Peo 叶绿体 基因 组 

Rosa praelucens 


trnK-UUU. 
matk 


chloroplast genome 
157 173-157 261 bp 


PSbA 
tmH-GUG 


/p23 
Cay 


ERI Photosystem I 
FII Photosystem II 


ADH dehydrogenase 
# 送 化 酶 大 亚 基 RubisCO large subunit 
RNA polymerase 

\ 亚 基 Small subunit of ribosomal proteins (SSU) 
白 大 亚 基 Large subunit of ribosomal proteins (LSU) 


Transfer RNAs o 8 es 
ERNA Rribosomal RNAs 人 EET) 
酶 基因 clpP, matK N B 
4 E 


i 框 (ycj) Hypothetical chloroplast reading frames (vcf) 


车 因 顺 时 针 方 向 转录 ， 环 外 基因 逆 时 针 方 向 转录 
Genes inside the circle is transcribed clockwise, while those outside is transcribed counterclockwise 


图 1 中 旬 刺 玫 叶 绿 体 基 因 组 环 状 图 


Fig.1 Chloroplast genome map of Rosa praelucens 


表 2 中 多 刺 玫 种 内 不 同 代表 性 植株 的 叶绿体 基因 组 特征 


Table 2 Characteristics of the chloroplast genome of representative Rosa praelucens individuals 


Ba 


编 ” 号 长度 Length (bp) GC 含量 GC content (96) 
Code 总 长 Total K Ž # 小 单 找 贝 反 向 重 全 基因 KAHAN 小 单 找 贝 反 向 重 
length 贝 区 LSC X SSC 复 区 IR 2H Total [X LSC [X SSC & [X IR 

0-1 157184 86311 18765 26054 37.2 35.2 31.2 42.7 
0-2 157186 86313 18765 26054 37.2 35.2 31.2 42.7 
0-3 157230 86319 18803 26054 37.2 35.2 31.2 42.7 
0-4 157230 86319 18803 26054 37.2 35.2 31.2 42.7 
1-1 157188 86315 18765 26054 37.2 352 31.2 42.7 
1-2 157186 86313 18765 26054 37.2 35.2 31.2 42.7 
1-3 157187 86314 18765 26054 37.2 35.2 31.2 42.7 
1-4 157186 86313 18765 26054 37.2 35.2 31.2 42.7 
1-5 157185 86312 18765 26054 37.2 35.2 31.2 42.7 
2-1 157177 86304 18765 26054 37.2 35.2 31.2 42.7 
2-2 157180 86307 18765 26054 37.2 35.2 31.2 42.7 
2-3 157177 86304 18765 26054 37:2 35.2 31.2 42.7 
2-4 157178 86305 18765 26054 37.2 35.2 31.2 42.7 
2-5 157173 86300 18765 26054 37.2 35.2 31.2 42.7 
2-6 157179 86306 18765 26054 37.2 35.2 31.2 42.7 
2-7 157179 86306 18765 26054 37.2 35.2 31.2 42.7 
3-1 157230 86319 18803 26054 37.2 35.2 31.2 42.7 
3-2 157186 86313 18765 26054 37.2 35.2 31.2 42.7 
3-3 157231 86320 18803 26054 37.2 35.2 31.2 42.7 
3-4 157186 86313 18765 26054 37.2 35.2 31.2 42.7 


4-1 157186 86313 18765 26054 37.2 352 312 42.7 


4-2 157186 86313 18765 26054 37.2 352 31.2 42.7 


4-3 157186 86313 18765 26054 37.2 352 31.2 42.7 
5-1 157186 86313 18765 26054 37.2 352 31.2 42.7 
5-2 157186 86313 18765 26054 37.2 352 31.2 42.7 
6-1 157230 86319 18803 26054 37.2 352 31.2 42.7 
6-2 157229 86318 18803 26054 37.2 352 31.2 42.7 
6-3 157229 86318 18803 26054 37.2 352 31.2 42.7 
6-4 157230 86319 18803 26054 37.2 352 31.2 42.7 
6-5 157229 86318 18803 26054 37.2 352 31.2 42.7 
7-1 157261 86353 18800 26054 37.2 35.2 31.2 42.7 
7-2 157185 86312 18765 26054 37.2 35.2 31.2 42.7 
8-1 157229 86318 18803 26054 37.2 35:2 31.2 42.7 
8-2 157230 86319 18803 26054 37.2 352 31.2 42.7 
8-3 157230 86319 18803 26054 37.2 352 31.2 42.7 
8-4 157229 86318 18803 26054 37.2 352 31.2 42.7 
8-5 157185 86312 18765 26054 37.2 352 31.2 42.7 
8-6 157231 86320 18803 26054 37.2 352 31.2 42.7 
9-1 157213 86340 18765 26054 37.2 352 31.2 42.7 
9-2 157188 86315 18765 26054 37.2 352 312 42.7 


2.2 中 旬 刺 玫 叶 绿 体 基因 组 的 基因 构成 
表 3 可 知 ， 中 旬 刺 玫 的 叶绿体 基因 组 共 编 码 132 个 功能 基因 ， 包 括 87 个 蛋白 质 编码 
基因 ，37 tRNA 基因 和 8 个 rRNA 基因 。 其 中 ， 与 光合 作用 有 关 的 基因 有 45 个 ， 与 自我 
复制 相关 的 基因 有 76 个 ， 功 能 未 知 的 其 他 基因 共 11 个 。6 个 蛋白 编码 基因 (zadapB、7Pp12、 
rpl23 yps7  rps12sycf2) 7 ^S tRNAs (trnA-UGC, trnI-CAU trnl-GAU, trnL-CAA trnN-GUU, 
trnR-ACG«.  trnV-GAC) 和 4 个 rRNAs Crrnl6. rrn23. rrn 4.5, rrn5) Æ IR XEZER. 
在 132 个 基因 中 , petB , petD . ndhA , ndhB y rpsl6. rpI2, rpll6, rpoC1 , trnA-UGC , trnl-GAU , 
trnK-UUU , frnL-UAA., trnV-UAC 等 13 个 基因 有 1 个 内 含 子 ,ycf3 和 clpP 这 两 个 基因 各 有 
两 个 内 含 子 ，rps12 为 反 式 剪接 的 基因 ， 其 $' 端 在 LSC 区 ， 而 3 mE RKE. 

de 3 中 多 刺 玫 叶 绿 体 基 因 组 的 基因 构成 


Table 3 Gene composition of chloroplast genomes of R. praelucens 


功能 Function 基因 家 庭 Gene family DX] Gene 
光合 作用 ATP 合成 酶 基因 ATP synthase atpA, atpB, atpE, atpF, atpH, atpl 
Photosynthesis 细胞 色素 复合 体 基 因 Cytochrome b/f D pellit peii * pent pati; peiN 
complex 
NADH 合成 酶 基因 NADH ndhA*, ndhB* * ndhC, ndhD, ndhE, ndhF, 
dehydrogenase ndhG, ndhH, ndhl, ndhJ, ndhK 
JRA I 基因 Photosystem I psaA, psaB, psaC, psal, psaJ 
psbB, psbT, psbH, psbN, psbJ, psbL, psbF, 
HRA TI AEA] Photosystem II psbE, psbZ, psbC, psbD, psbM, psbl, psbK, 
psbA, 
二 磷酸 核 酮 糖 氧 化 酶 基因 Rubisco large 
rbcL 
subunit 
自我 复制 核糖 体 蛋 白 小 亚 基 基因 Ribosomal rps2, rps3, rps4, rps7”, rps8, rpsll, rps12*, 
self-replication proteins (SSU) rps14, rps15, rps16*, rps18, rps19 
核糖 体 蛋 白 大 亚 基 基因 Ribosomal rpl2**, 1D114, rpll6*, rpI20, rpI22, rpl23*, 
proteins (LSU) rpl32, rpl33, rpl36 
RNA 聚合 酶 基因 RNA polymerase rpoA, rpoB, rpoC1*¥, rpoC2 
trnA-UGC**, trnC-GCA, trnD-GUC, 
trnE-UUC, trnF-GAA, trnG-UCC, trnG-GCC*, 
trnH-GUG, trnl-CAU', trnl-GAU*', 
trnK-UUU*, trnS-GCU, trnL-CAA", 
转运 RNA 基因 Transfer RNAs trnL-UAA*, trnL-UAG, trnM-CAU, 
trnN-GUU", trnP-UGG, trnQ-UUG, 
trnR-UCU, trnS-GGA, trnS-UGA, trnR-ACG", 


trn T-UGU, trnT-GGU, trnV-UAC*, 
trnW-CCA, trnV-GAC" 
核糖 体 RNA 基因 rRNAs rrn16*, rrn23*, rrn4.5*, rrn5* 


K'E Others 假定 叶绿体 阅读 框 Hypothetical yefl, ycPP ycf3**, ycfA 


chloroplast reading frames (ycf) 


乙酰 -CoA- 羧 化 酶 的 亚 基 accD 
Acetyl-CoA-carboxylase subunit 
和 蛋白酶 基因 Protease gene clpP** 
包 膜 蛋白 基因 Envelope protein gene cemA 
c 型 细胞 色素 合成 基因 Type c ccsA 
cytochrome synthesis gene 
成 熟 酶 基因 Mature enzyme gene matK. 
转录 起 始 因 子 Transcription initiation infA 
factor 
HE: * 表 示 有 一 个 内 含 子 ， 闪 表示 有 两 个 内 含 子 ， RRRA IZ: “表示 在 IR. 区 有 两 个 反 向 重复 拷贝 。 


indicates genes with two copies in the IR region. 


2.3 中 旬 刺 玫 叶 绿 体 基 因 组 密码 子 偏好 性 


H 


P 旬 刺 玫 的 叶绿体 基 


尾 。 


因 组 密码 子 使 用 频率 (RSCU) 如 表 4。 全 部 基因 共 1 


子 编码 ， 其 中 亮 氨 酸 (leucine) 是 
占 总 数 的 10.85%， 而 组 氮 酸 (histidine) 是 使 
码 子 ， 占 总 数 的 1.95%。 以 A- 和 U- 为 末端 的 密码 
氨 酸 Arg-AGG 和 甘氨酸 Gly-GGG 以 外 ， 所 有 的 首选 同 义 密码 子 (RSCU > 1) 都 是 以 A 或 U 结 


使 用 频率 最 


IR] 的 氨基 酸 , 


4i 


ZN 


adr 二 


] 频 率 最 低 的 氨基 酸 ， 仅 编 


子 较 常见 ， 除 了 trnL-CAA、trnS-GGA、 精 


表 4 中 旬 刺 玫 的 密码 子 - 反 密 码 子 识 别 模式 及 密码 子 偏好 


Note: * indicates genes with one intron; ** indicates genes with two introns; # indicates trans-spliced gene; ” 


27 155 个 密码 


的 2 765 个 密码 子 ， 
码 了 其 中 的 530 个 密 


Table 4 Condon-anticodon recognition patterns and codon usage of the Rosa praelucens 


chloroplast genome. 


(ERE 密码 子 数量 “相对 同 义 密码 (ERE 密码 子 数量 相对 同 义 密 
Amino Acid Codon Count 子 RSCU Amino Acid Codon Count 人 码 子 RSCU 
METE UUU(F) 1092 121 UCU(S) 504 1.26 
AWWABRPhe — Dro E) 706 0.79 Bika UC) 422 1.06 
UUA(L) 597 13 z UCA(S) 477 1.19 
UUG(L) 619 1.34 UCG(S) 342 0.86 
zamra. TUO 556 1.21 CCU(P) 262 11 
CUC(L) 319 0.69 mmn, CECO) 207 0.87 
CUA(L) 393 0.85 CCA(P) 272 1.14 
CUG(L) 281 0.61 CCG(P) 211 0.89 
AUUO 925 1.35 ACU(T) 352 1.14 
TRAR Ile ^ AUCI 517 0.75 PE ACC(T 280 0.91 
uem AU "i 615 0.9 Ze Thr WA 375 1.22 
甲 硫 氨 酸 Met — AUG(M) 571 1 ACG(T) 223 0.73 
GUU(V) 421 135 GCU(A) 239 124 
HUE Val ^ GUC(V) 208 0.67 Tek GCC(A) 176 0.91 
GUA(V) 372 1.2 WERE Ala — SCA) 223 1.16 
GUG(V) 244 0.78 GCG(A) 134 0.69 
kann — UAUOO 800 133 EaR  UGU(C) 382 1.13 
f M UAC(Y) 405 0.67 Cys UGC(O) 292 0.87 
* 终止 子 st * 
终止 子 stop 。 UAACO 488 1.07 ET stop  UGAC) 445 0.97 
UAG) 439 0.96 EAR Trp ^ UGG(W) 542 1 
CAU(H) 352 1.33 CGU(R) 218 0.72 
Z E= 
HAR His CACH) 178 0.67 EAR ”CGC(R) 141 0.46 
FOE CAA(Q) 547 1.32 Arg CGA(R) 304 1 
AU Gn CAGO) 283 0.68 CGG(R) 261 0.86 
a AAU(N) 957 1.34 丝氨酸 AGU(S) 362 0.91 
A 
REMI Asn AACN) 470 0.66 Ser AGC(S) 292 0.73 
ERU AAA(K) 1015 1.26 精 氨 酸 。 AGA(R) 526 1.73 
BAURIYS AAGE) 590 0.74 Arg AGG(R) 370 122 
EAR As —OAUD) 628 146 GGU(G) 350 0.98 
^ P ^ GAC(D) 235 0.54 EN GGC(G) 224 0.63 
谷 氨 酸 GAA(E) 691 13 HWBRGly GGA) 458 1.28 
Glu GAG(E) 375 0.7 GGG(G) 400 1.12 


2.4 中 旬 刺 玫 叶 绿 体 基因 组 的 微 卫 星 重复 序列 


ERFYL, REg 


重复 序列 分 析 结 果 表 明 ， 中 旬 刺 玫 的 叶绿体 基因 
E 复 序列 长 度 大 多 为 20~30 bp《〈 表 5) 。 最 


(GAC) 基因 


E 向 重复 序列 和 3 个 反 向 


间隔 区 和 ndhA 基 因 的 内 含 子 区 域 。 大 多 数 


EE 复 序 列 分 别 位 于 xrps12-trnV 
EE 复 序列 位 于 LSC 区 和 IR 区 ， 还 有 9 


个 重复 序列 在 不 同 的 区 域 开 始 ， 如 第 1 号 重复 的 两 个 序列 分 别 开 始 于 IRB 区 和 SSC 区 。 


RS 中 甸 刺 玫 叶 绿 体 基 因 组 序列 


EY 


Table 5 Repeat sequences in Rosa praelucens chloroplast genome 


昔 酸 SSRs (A/T/G/C) 最 多 ， 


三 核 苔 酸 类 型 


大 部 分 为 单 纪 


( 表 6) 。58 个 SSRs 位 于 LSC 区 ， 占 全 部 SSRs 的 79.5%，5 个 位 于 
个 。 只 有 23 个 SSRs 位 于 基因 
这 与 cpSSRs 主 要 由 短 腺 嗓 叭 (adenine，A) 或 胸 
EXE (guanine, G) 和 胞 喀 啶 (cytosine, C). 组 成 的 假说 相 一 致 。 
表 7 中 旬 刺 玫 叶 绿 体 基 因 


Et 有 50 个 ; 其 次 是 二 核 苷 酸 类 型 CAG/AT/TA/TO) ， 有 13 个 ， 
J 有 5 个 ， 四 核 音 酸 类 型 有 11 个 ， 六 核 昔 酸 SSRs 有 2 个 ， 没 有 五 核 苷 酸 SSRs。 绝 


编号 重复 第 1 个 开始 ”重复 类 型 ”重复 长 度 重复 第 2 个 所 在 具体 位 置 所 在 区 域 
Code 处 Repeat Start ] Repeat type Size (bp) 处 Repeat Start 2 Mismatch (bp) Location Region 
1 100770 F 40 122818 ndhA IRB, SSC 
2 44997 F 39 100772 ycf3; IGS LSC, IRB 
3 44997 F 38 122820 ycf3; ndhA LSC, SSC 
4 59254 F 34 59285 IGS LSC 
5 123010 R 37 123023 ndhA SSC 
6 109739 F 32 109771 IGS IRB 
7 133696 F 32 133728 IGS IRA 
8 67436 F 25 67460 IGS LSC 
trnG-GCC, 
9 9822 F 27 37714 trnG-UCC LSC 
8380 F 29 36640 trnS-GCU, trn$-UGA LSC, IRB 
91108 F 29 91129 ycf2 IRB 
152341 F 29 152362 ycf2 IRA 
51039 F 22 51060 IGS LSC 
43196 F 25 147743 IGS LSC, IRA 
58610 F 25 58635 rbcL; IGS LSC 
39962 F 30 42186 psaB; psaA LSC 
10499 F 21 10520 IGS LSC 
8733 F 29 65172 IGS LSC 
83661 F 29 122808 rpll6, ndhA LSC, SSC 
10623 F 20 10647 IGS LSC 
13570 F 20 90104 IGS, ycf2 LSC, IRB 
28582 F 20 28602 IGS LSC 
33042 R 20 86327 IGS LSC, IRB 
67511 F 20 67530 IGS LSC 
120144 F 20 120164 IGS SSC 
133705 F 23 133737 IGS IRA 
8669 F 28 31214 IGS LSC 
12223 F 28 72420 IGS, cipP LSC 
83667 F 28 122814 rpll6, ndhA LSC, SSC 
7598 R 25 61186 IGS LSC 
83670 F 25 100769 rpl16, IGS IRB 
37582 F 22 37604 IGS LSC 
43764 F 22 73530 IGS, cipP LSC 
45662 F 22 142499 ycf3; IGS IRA 
109749 F 22 109781 IGS IRB 
5203 F 24 127726 IGS; ycfl SSC 
HS 了 表示 正 向 重复 ，R 表示 反 向 重 
Note: F indicates forward repeat; R indicates reverse repeat. 
2.5 中 旬 刺 玫 叶 绿 体 基因 组 的 简单 重复 序 
MISA 软 件 在 中 旬 刺 玫 的 叶绿体 基因 组 中 共 找 到 E 复 序列 (SSRs) ， 其 中 单 核 


类 型 SSRs， 复 合 类 型 的 SSRs 较 少 ， 二 者 分 别 为 65 个 和 8 个 ， 没 有 间接 型 SSRs 


中 ， 其 它 均 位 于 基因 


区 ，IRA 和 IRB 区 各 有 5 


间隔 区 。 单 核 苷 酸 SSRs 中 的 74% 属 于 A/T， 
IREE Cthymine, T) 重复 组 成 而 很 少 有 串 


Table 7 Simple sequence repeats (SSRs) in R .praelucens chloroplast genome 


序 号 类 型 简单 重复 序列 大 小 ”开始 位 ”结束 位 所 在 区 域 基因 Gene 

Code Type SSR Size — 置 Start 置 End Region 

1 pl (A)15 15 185 199 LSC 

2 pl (A)12 12 3764 3775 LSC trnK-UUU 

3 pl (A)15 15 4361 4375 LSC 

4 pl (O11 11 6187 6197  LSC rps16 

5 c (T)1latatcattctaaattttagaatatttttcgattattgtaaaaat 104 6478 6581 LSC 
caaattagttaactaaattctaactaaatataacace( AATA)3 

6 p2 (AG)5 10 6791 6800 LSC 

7 pl (A)12 12 6971 6982 LSC 

8 p2 (AT)6 12 7163 71714 | LSC 

9 p3 (TAAM 12 8319 8330  LSC 

10 pl (A)10 10 8508 8517  LSC 

11 pl (A)20 20 8678 8697  LSC 

12 c (T)12attttaatatt(A)11 34 9894 9927 LSC 

13 p2 (AT)9 18 10115 10132 LSC 

14 p3 (TTA)4 12 10368 10379 LSC 

15 pl (T)13 13 12228 12240 LSC 

16 pl (O11 11 14297 14307 LSC 

17 pl (D11 11 18416 18426 LSC rpoC2 

18 p2 (TA)5 10 19785 19794 LSC rpoC2 

19 pl (T)10 10 26132 26141 LSC rpoB 

20 pl (T)10 10 28994 . 29003 LSC 

21 pl (C)14 14 29627 29640 LSC 

22 c (AAT)4tc(T)10 24 30565 30588 LSC 

23 pl (A)14 14 30722 30735 LSC 

24 pl (T)10 10 33042 33051 LSC 

25 p2 (TA)5 10 36876 36885 LSC 

26 c (ATAA)3tataa(AT)5 27 37632 . 37658 LSC 

27 p2 (TA)5 10 44657 44666 LSC ycf3 

28 pl (A)10 10 45663 | 45672 LSC ycf3 

29 pl (A)12 12 45979 | 45990 LSC 

30 pl (T)10 10 46522 | 46531 LSC 

31 pl (A)14 14 47885 41898 LSC 

32 pl (A)11 11 48476 48486 LSC 

33 p4 (TAAT)3 12 48666 48677 LSC 

34 pl (T)14 14 48850 48863 LSC 

35 c (A)l3gaatcgaccgttcaagtattcaaaattgcacactaaaaat 91 48965 49055 LSC 
gatagaaaatcatagaaattgggacatg(TA)5 

36 pl (T)10 10 49785 | 49794 LSC trnL-UAA 

37 p4 (TTTA)3 12 51007 51018 LSC 

38 c (TA)St(TA)S 21 53297 53317 LSC 

39 c (T)10caagtgcggaaaccccaggaccagaagtagtaggattt 112 56377 56488 LSC atpB 
attctcataataaaatatgtcgaaatttttttgcgaaaatgactgaa 
atcaa(AAAT)3 

40 p4 (AATT)3 12 58966 58977 LSC 

41 c (T)10ataggtatttagt(A) 10 33 61024 61056 LSC 

42 pl (D12 12 61394 61405 LSC 

43 p2 (TC)5 10 62863 62872 LSC cem A 

44 pl (G)10 10 64968 | 64977 LSC 

45 pl (T)10 10 66847 . 66856 LSC 

46 pl (D11 11 69049 69059 LSC 

47 pl (A)11 11 70255 70265 LSC 

48 pl (T)12 12 71742 71753 LSC 

49 pl (T)12 12 72425 72436 LSC clpP 

50 pl (D11 11 73436 73446 LSC clpP 

51 p2 (AT)6 12 74110 74121 LSC 

52 pl (A)12 12 79712 | 79723 LSC 

53 pl (A)14 14 70874 79887 LSC 

54 p4 (AIGT)3 12 80012 80023 LSC rpoA 

55 pl (D11 11 82081 82091 LSC 

56 pl (A)10 10 83136 83145 LSC 

57. pl (A)10 10 83991 84000 LSC rpl16 

58 pl (T)15 15 85420 | 85434 LSC 

59 p3 (TAT)4 12 87117 87128 IRB rpl2 

60 pe (TAGAAG)4 24 94485 94508 IRB ycf2 

61 pl (D10 10 102111 102120 IRB 


62 p4 (AGGT)3 12 108333 108344 IRB rrn23 
63 p4 (TTTA)3 12 110521 110532 IRB 
64 pl (D10 10 121335 121344 SSC 
65 p2 (AT)6 12 122168 122179 SSC 
66 pl (A)10 10 123061 123070 SSC ndhA 
67 pl (D13 13 123308 123320 SSC ndhA 
68 pl (D10 10 130333 130342 SSC ycfl 
69 p4 (AATA)3 12 132966 132977 IRA 
70 p4 (CTAC)3 12 135154 135165 IRA rrn23 
71 pl (A)10 10 141380 141389 IRA 
72 p6 (CTTCTA)4 24 148992 149015 IRA ya 
7 p (ATAM 12 156372 156383 IRA rpl2 


2.6 中 旬 刺 玫 种 内 的 叶绿体 基因 组 序列 差异 


中 甸 刺 下 种 内 不 同 个 体 的 叶绿体 基因 组 序列 差异 较 小 。 所 有 代表 性 个 体 的 全 基因 
组 序列 比 对 分 析 共 检测 58 个 变异 位 点 共 22 个 单 倍 型 ， 单 倍 型 多 样 怕 


多 态 性 为 0.000 12。 种 内 叶绿体 基因 组 在 基因 、 基 因 间 隔 区 的 


核酸 多 态 性 都 较 低 ， 相 对 多 


EW 0.928+0.027， 核 酸 


太 


TM 


性 较 大 的 是 位 于 LSC 区 的 psbI-trn$(GCU). trn$ CGCU)-trnG(UCC). trnG(UCC)-trnfM(CAU), 


petN-trnD(GUC)., petA-psbJ. psaA-ycfà 等 基因 间隔 区 ， 以 及 


rps16 和 ycfl 等 基因 


(图 2) 。 


Mauve 比 对 的 结果 表明 中 多 刺 玫 种 内 不 同 代 表 性 个 体 的 叶绿体 基因 组 在 结构 上 没有 大 变化 ， 


不 存在 大 片段 或 基因 的 逆转 或 者 丢失 (图 3) 。 
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叶绿体 基因 组 位 置 Chloroplast genome position 


滑 窗 大 小 =1000 bp， 步 长 =1000bp。 
window length=1000 bp, and step sizes-1000 bp. 


图 2 中 旬 刺 玫 种 内 叶绿体 基因 组 的 核酸 多 态 性 


Fig. 2 Nucleotide diversity (pi) among the chloroplast genomes of 40 Rosa praelucens individuals 
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以 NCBI 序列 号 MG450565 的 中 旬 刺 玫 叶 绿 体 基 因 组 参照 , 用 线 连 接 的 颜色 相同 的 块 表示 局 部 共 线 块 。 
The chloroplast genome of R. praelucens with the NCBI accession No. MG450565.1 was used as reference. The 
local collinear blocks are represented by blocks of the same color connected by line. 


3 中 旬 刺 玫 种 内 代表 性 植株 的 叶绿体 基因 组 Mauve 比较 


Fig. 3 Mauve alignment of the chloroplast genomes of representative Rosa praelucens individuals 
3 讨论 与 结论 


虽然 植物 的 叶绿体 基因 组 在 基因 组 成 和 排列 顺序 上 具有 较 高 的 保守 性 ,但 由 于 长 期 对 不 
同 环 境 的 适应 常 导致 同属 植物 的 叶绿体 基因 组 在 大 小 上 发 生 改变 ， 产 生 结 构 重 排 以 及 IR 区 
的 收缩 或 扩张 等 〈Daniell et al., 2016) 。 中 旬 刺 玫 不 同 表 型 40 个 代表 性 个 体 的 叶绿体 基因 
组 大 小 为 157 173-157 261 bp， 整 个 基因 组 共 编 码 132 个 基因 ， 主 要 与 光合 作用 和 自我 复制 
相关 。 与 同属 的 单 办 月 季 花 (Jian et al., 2018b)、 亮 叶 月 季 CR. lucidissima) (Zhao et al., 2019), 
木 香花 CR. banksiae) 〈 杨 芳 ，2019) ， 大 花香 水 月 季 CR. odorata var. gigantea) (Yang et al., 
2014), EIRT CR. laevigata) CYin et al., 2020) 以 及 其 它 种 (Chen et al., 2019; Cui et al., 2022) 
的 叶绿体 基因 组 相 比 ,中旬 刺 玫 的 基因 组 除 在 长 度 上 明显 大 500 bp 左右 外 , 在 基因 组 的 GC 
含量 、 基 因 构 成 和 排列 顺序 上 与 其 它 种 基本 一 致 ， 表 明 茧 薇 属 植物 的 叶绿体 基因 组 较 保 守 ， 
种 间 差 异 较 小 ， 主 要 在 非 编 区 有 序列 长 度 的 变化 。 

密码 子 是 连接 核酸 和 和 蛋白质 的 纽带 , 研究 物种 的 密码 子 偏好 并 确定 最 优 密码 子 ,， 有 助 于 
设计 基因 表达 载体 来 提高 目的 基因 的 表达 量 , 在 作物 遗传 育种 和 品种 改良 方面 具有 重要 应 用 
价值 (Qi et al., 2015)。 密 码 子 偏好 性 分 析 显 示 中 旬 刺 玫 的 叶绿体 基因 组 编码 密码 子 中 ， 亮 氨 
酸 是 使 用 频率 最 高 的 氨基 酸 ， 而 组 氨 酸 使 用 频率 最 低 。 此 外 ， 中 旬 刺 玫 所 有 的 首选 同 义 密码 
子 都 是 以 A 或 U 结 尾 (RSCU > 1) ， 由 于 RSCU 大 于 1 则 表示 实际 频率 高 于 其 他 同 义 密 码 子 的 
使 用 频率 〈 晃 岳 罗 等，2012) ， 因 此 中 旬 刺 玫 的 密码 子 偏好 以 A- 和 U- 结 尾 。 这 与 同属 的 单 
办 月 季 花 的 密码 子 偏 好 性 (Jian et al., 20180) 基本 一 致 ， 为 研究 相关 基因 的 分 子 进化 和 外 源 
表达 黄 定 了 基础 。 


植物 的 叶绿体 简单 重复 序列 〈cp-SSRs) 为 单亲 遗传 且 有 较 高 的 种 内 多 态 性 ， 是 物种 进 
化 和 多 态 性 的 重要 遗传 标记 (Cavalier, 2002) ， 常 被 用 于 野生 植物 的 系统 演化 和 居 群 遗传 古 
究 (Provan, 2000; Flannery et al., 2006) 以 及 作物 遗传 图 谱 构 建 的 分 子 标记 (Powell et al., 1995; 
Xue et al., 2012) . 由 于 poly A 和 poly T 相 比 poly C 和 poly G 可 能 具有 更 高 的 结构 稳定 性 CGragg 
et al., 2002) ， 大 多 数 植物 的 叶绿体 基因 组 单 核 苷 酸 SSRs 多 为 poly A 和 poly TESTA. FP 4AE 
叶绿体 基因 组 中 共有 73 个 简单 重复 序列 cpSSRs， 主 要 为 单 核 音 酸 SSRs， 大 部 分 由 短 腺 味 吟 
CAO 或 胸腺 喀 啶 CTO 重复 组 成 , 主要 位 于 LSC 区 的 基因 间隔 区 , 与 同属 的 单 兴 月 生花 Jian 
etal,2018b) 基本 一 致 ， 也 与 其 它 多 种 植物 如 山茶 属 〈ComeWia) 〈 了 本 祥 青 等 ，2022; XK 
4, 2023) 、 绢 项 属 CSeriphidium) (Jin et al., 2023) 等 类 似 。 

已 有 的 研究 表明 蔷薇 属 内 不 同 物种 的 叶绿体 基因 组 间 的 核酸 高 变 区 主要 位 于 LSC 区 的 
trnK-rpsl6. psl6-trnQ« trnS-trnG.. atpF-atpH« rps2-rpoC2 等 多 个 基因 隔 区 、rps19 和 ycfl 
等 基因 的 编码 区 ， 以 及 rp12、rps16、ndhA 等 基因 的 内 含 子 区 域 (Jian etal., 2018b) 。 中 人 
刺 玫 种 内 不 同 表 型 代表 性 个 体 的 全 基因 组 核酸 多 态 性 较 低 ,核酸 多 态 性 相对 较 高 的 是 位 于 
LSC 区 内 的 petN-trnD(GUC). petA-psbJ. psaA-ycf3 等 少数 几 个 基因 间隔 区 ， 以 及 rps16 和 
yfl 等 少数 几 个 基因 。 结 合 Mauve 比 对 的 结果 ， 说 明 中 旬 刺 玫 种 内 的 叶绿体 基因 组 的 基因 
序列 和 结构 均 高 度 保守 , 不 存在 大 片段 序列 或 基因 的 逆转 或 者 丢失 , 其 种 内 不 同 个 体 的 表 型 
变异 不 是 由 于 叶绿体 基因 组 的 变异 。 

综 上 所 述 , 在 对 中 旬 刺 玫 的 叶绿体 基因 组 进行 简单 报道 的 基础 上 , 详细 地 分 析 了 中 旬 刺 
玫 叶 绿 体 基因 组 的 基因 构成 、 密 码 子 偏好 以 及 简单 重复 序列 等 基本 特征 ,并 对 种 内 具有 不 同 
表 型 的 代表 性 个 体 的 叶绿体 基因 组 进行 了 比较 基因 组 分 析 , 结果 表明 中 多 刺 下 种 内 的 叶绿体 
基因 组 大 小 、 序 列 和 基因 结构 等 方面 均 高 度 保守 ,不 存在 大 片段 序列 或 基因 的 逆转 或 者 丢失 ， 
研究 结果 为 中 旬 刺 玫 的 保护 和 开发 利 提供 了 叶绿体 基因 组 方面 基础 数据 .研究 也 表明 中 多 刺 
玫 种 内 丰富 的 表 型 变异 不 是 由 于 叶绿体 基因 组 的 变异 ,结合 中 旬 刺 玫 的 高 倍 性 特征 , 应 从 染 
色 体 的 数量 和 结构 、 基 因 表 达 甚 至 表 观 遗传 等 角度 进行 进一步 深入 系统 的 研究 。 
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